SupraBench: un benchmark para química supramolecular
Descubre cómo SupraBench evalúa LLMs en tareas fundamentales de química supramolecular. Un benchmark innovador para predecir afinidades y más.
Descubre cómo SupraBench evalúa LLMs en tareas fundamentales de química supramolecular. Un benchmark innovador para predecir afinidades y más.
Evalúa el razonamiento químico de los LLMs con ChemCoTBench-V2, un benchmark verificable paso a paso que detecta fallos en la lógica ocultos tras respuestas correctas.
LatentChem: razonamiento químico con pensamiento latente. Logra 59.88% de victorias frente a CoT y 10x menos pasos. Optimización sin cadenas textuales.